画像を開く
起動時に、インターネット接続とGoogle ドライブへのアクセスのチェックを行いますので、起動に少し時間が掛かる場合があります。
「
画像を開く(O)」か、メニューの「
ファイル(F)」-「
画像を開く(O)」で、画像を選択するダイアログが表示されますので、OCRを行いたいファイルを読み込みます。クリップボードに有効な画像データがある場合は、「
クリップボード(B)」でも可能です。
正常に読み込まれると、サムネイル画像が表示されます。
画像は、幅、高さのいずれか大きい方が、2400ピクセルより大きい場合は、2400ピクセルに縮小して読み込みます。
読み込んだ画像は、全て作業用フォルダに一時的にコピーされますので、リストから削除したり画像を編集しても、元の画像に影響は一切ありません。
PDFを読み込ませた場合、次のようなダイアログが表示されます。
処理選択ダイアログ
Google ドライブでは、通常の画像ファイルの他に、PDFも認識できますので、そのままアップロードして認識させるか、画像に変換してから認識させるか選択できます。
「
画像に変換してから読み込む(I)」を選択した場合は、画像に変換してから読み込まれます。「
そのまま読み込む(I)」を選択した場合は、画像に変換せずにそのまま読み込みます。その場合は、画像のサムネイルは表示されず、PDFのアイコンになります。
PDFを読み込ませた際のデフォルト動作は、設定の「
基本設定」で、「
都度選択する」、「
画像に変換して読み込む」、「
そのまま読み込む」のいずれかから設定出来ます。「
都度選択する」以外に設定すると、このダイアログは表示されず、設定した処理を行います。
PDFをそのまま読み込んだ場合
複数ページで構成されているPDFを画像に変換して読み込む場合、変換するページを指定するダイアログが表示されます。
「
全ページ(A)」を選択すると、全てのページを画像に変換して読み込みます。「
ページ指定(R)」を選択すると、読み込むページを指定できます。ページの指定には、「
1,3,6」の様に直接ページを指定したり、「
4-8」の様に範囲を指定することもできます。「
2,5,10-25」といった指定も可能です。
マルチページのTIFFを読み込む場合も同様に、ページ選択のダイアログが表示されます。
ページ選択ダイアログ
ファイルを開くためのパスワードが設定されているPDFを読み込んだ場合、パスワード入力を求めるダイアログが表示されます。パスワードを入力すると、画像に変換して読み込みます。
※パスワード保護されているPDFはそのままアップロードすることはできませんので、必ず画像に変換されます。
パスワード入力ダイアログ
スクリーンキャプチャ
パソコンの画面をキャプチャして、認識させることができます。
スクリーンキャプチャを開始すると、本アプリが非表示になり、画面全体が暗くなります。マウスの左ボタンをクリックして開始点を指定し、ドラッグして範囲を指定します。指定された範囲は明るくなり、終点でマウスのボタンを放すと、その範囲が取り込まれます。ESCキーでキャンセルできます。
マルチモニタにも対応しています。
スクリーンキャプチャ
クリップボード監視
メニューの「
設定」-「
クリップボード監視」、もしくは、ステータスバーの「
クリップボード監視」をクリックしてオンにすることにより、クリップボード監視モードがオンになります。
「
クリップボード監視」がオンの場合、他のアプリ等で画像をクリップボードにコピーすると、自動的に本アプリに取り込みます。エクスプローラでファイルをクリップボードにコピーした場合にも自動的に取り込まれます。対応したファイル以外は無視されます。画像編集画面を表示している場合は監視機能は働きません。
画像編集
リストのサムネイル画像をダブルクリック(左ボタン)、メインメニューの「
編集(E)」-「
画像を編集(E)」、コンテクストメニューの「
画像を編集(E)」のいずれかで、画像編集画面が表示されます。
パソコンにインストールされている他の画像編集ソフトで編集したい場合は、コンテクストメニューの「
プログラムから開く(H)」から、編集したいソフトを選びます。
※パソコンにインストールされているにも関わらず、リストにそのソフトが表示されない場合は、エクスプローラーの「プログラムから開く(H)」を実行し、編集したいアプリで1度画像を読み込ませてください。以降は、リストに表示されます。
表示
メニューの「
表示(V)」で、画像リストの表示方法を変えることができます。
表示方法は、「
大アイコン」、「
小アイコン」、「
一覧」、「
詳細」の4つあります。
「
詳細」の表示の場合は、認識結果も表示されます。
大アイコン
小アイコン
一覧
詳細(※認識実行後)
一括OCR(順次認識)
メインメニューのリストに登録されている画像を連続で一気に認識させるには、「
一括OCR(A)」をクリックします。
クリックすると、確認のダイアログが表示され、「
はい」をクリックすると、登録されている画像を全て順に処理します。
登録されている画像が順に認識されます。
認識終了後、それぞれの画像を開くと、右ウインドウに結果が表示されます。
一括OCR(結合認識)
リストの左の□にチェックを入れた状態で「
一括OCR(A)」をクリックすると、チェックされている画像を1枚に結合して認識します。
Google Drive APIを用いて文字認識を行う際、ファイルのアップロードや結果のダウンロードなどのファイル操作に時間が掛かります。例えば、100行のテキスト画像と1000行のテキスト画像をそれぞれ認識させた場合、処理時間は体感的にはほとんど変わりません。従って、ファイル数が多いとそれだけファイル処理にかかる時間も大きくなり、これが大きなオーバーヘッドになります。そこで、複数の画像を1枚に合成し、一気に認識させることで処理を高速化することができます。
ただし、Google ドライブでのOCRの制限で、ファイルサイズが大きい場合はうまく認識できません。色々試してみた結果、通常の画像ファイルであれば、10MByte程度までなら認識できるようです。本アプリでは、1ファイルが9MByte以下になるようにファイルを複数枚に分けて合成して認識させます。PDFの場合は、チェックを付けても合成せずにそのままアップロードします。PDFの場合は15MByte程度までは認識できるようです。
※□にチェックを入れた場合、チェックの付いたファイルのみ認識を実行します。チェックの付いていない画像は認識されませんのでご注意ください。
結合認識のデメリット
結合認識は高速で認識処理ができますが、デメリットがあります。
OCR認識枠を指定せず、複雑なレイアウトの画像を結合して認識した場合、レイアウトが崩れて認識されることがあります。(通常通りの認識でも、複雑なレイアウトの場合はレイアウトが崩れることが多いです。)その場合は、なるべく細かくOCR認識枠を指定するか、単独で認識させてみてください。
終了
通常の終了
「終了(Q)」ボタンをクリックするか、フォーム右上の「×」をクリック、もしくは、メニューの「ファイル」-「終了(Q)」で終了します。
リストをクリアして終了
初期設定では、「クリアして終了(C)」ボタンはグレー状態でクリックできません。
「設定」-「基本設定」の「前回の状態を復元して起動する(E)」にチェックを入れるとクリックできるようになり、基本設定の「前回の状態を復元して起動する(E)」にチェック入っている場合でも、リストを全てクリアして終了します。
個別認識の実行
一括認識ではなく、個別に認識させたい場合は、認識させたい画像を選択し、メインメニューの「
編集(E)」-「
OCR実行(O)」、または、マウス右クリックで表示されるコンテクストメニューの「
OCR実行(O)」で可能です。
または、リストのサムネイル画像をダブルクリック(左ボタン)、メインメニューの「
編集(E)」-「
画像を編集(E)」、コンテクストメニューの「
画像を編集(E)」のいずれかで、画像編集画面を表示し、「
認識実行(O)」をクリックすることで個別に認識を行うことができます。
この状態で、「
認識実行(O)」をクリックすると、OCRが実行されます。実行中には、画面下に進行状況を表すプログレスバーが表示されます。
認識実行中画面
PDFをそのまま読み込んだ場合は、次のような画面になります。この場合は、
編集やOCR認識枠を設定することはできません。
PDF表示画面
Windows 10で、WebView2のランタイムがインストールされていない場合は、次のような画面になります。
ランタイムをインストールする場合は、「
ランタイムをインストール」をクリックすると、インストーラが起動します。ランタイムのインストールが終了すると、メイン画面に戻り、もう一度開くと表示されます。
WebView2 未インストールの場合(Windows 10)
メニューの「
設定(S)」-「
一括置換オン」をクリックしてチェックを付けるか、画面下の「
一括置換オフ」をクリックすることにより、基本設定の「
OCR実行後に、自動的に一括置換を行う(R)」の設定に関係なく、一時的に一括置換のオン・オフが切り替えられます。(一括置換の設定がされていない場合は、オンにしても何もしません。)
一括置換の一時的なオン/オフの切り替え
認識が終了すると、右ウインドウに結果が表示されます。
拡大・縮小
マウスホイールで、画像の拡大、縮小ができます。マウスを
右クリックしてドラッグすると、移動できます。
20%〜400%まで拡縮できます。
画像の移動
表示されている画像が画面に入りきらない場合は、
スクロールバーを移動させるか、
マウスの右ボタンを押してドラッグすることで、自由に移動できます。
OCR範囲指定認識
全体ではなく、
指定した範囲のみを認識させたい場合は、マウスの左クリックで範囲選択を開始し、ドラッグして範囲指定します。認識範囲は複数設定でき、左上に表示されている数字は認識する順番になります。
選択範囲は、ドラッグによる移動、さらに枠の端をドラッグすることで、拡大、縮小が自由にできます。範囲を削除する場合は、削除したい枠をクリックして(アクティブ)にして、メニューの「
編集」-「
削除(D)」か、コンテクストメニューの「
削除(D)」、もしくはキーボードの「
Delete」を押すことで削除できます。
この状態で、「
認識実行(O)」をクリックすると、選択範囲のみ認識されます。認識結果は、範囲の右隅に表示されている数字の順番で認識されます。
OCR認識枠の順序変更
認識範囲の順番を変えたいときは、メニューの「
編集(E)」-「
枠の順序変更(O)」、もしくはマウスの右クリックで表示されるコンテクストメニューの「
枠の順序変更(O)」を実行します。
「
OCR認識枠の順序変更」のモードになると、枠の色が青色に切り替わります。認識させたい順番に青枠をクリックしていきます。クリックして順番を決定した枠は、
数字が黒色に変わります。
全ての枠を選択し終わると、通常の赤色に戻ります。この状態で「
認識実行(O)」をクリックすると、指定された枠の順で認識されます。
画像編集
認識実行前に、不要な部分を削除したり、移動したりといった簡易的な画像編集が可能です。(
※PDFをそのまま読み込ませた場合は編集出来ません。)
画像の編集は、一時フォルダにコピーされた画像に対して行いますので、読み込ませた元の画像には一切影響はありません。
「
編集モード」にするには、「
認識実行」ボタンの右にある
をクリックします。クリックすると、「
編集モード」に変わります。
編集モード画面
基本操作
マウスの左クリックで、範囲の始点を決定し、そのままドラッグすると、青色の枠で範囲が選択されます。
範囲選択画面
その状態で、枠の端や角を左クリックしてドラッグすると、範囲の拡大・縮小ができます。
「
Delete」キーを押すと、範囲の画像が削除されます(背景色で塗りつぶされます)。
選択範囲の拡大/縮小
枠内をクリックすると、「
移動モード」になり、ドラッグで範囲の移動ができます。
選択画像の移動
「移動モード」中に、枠の端や角をドラッグすると、移動中の画像の拡大・縮小ができます。「
Shift」キーを押したままドラッグすると、アスペクト比を維持して拡大・縮小できます。
範囲以外をクリックすると、移動が決定されます。決定前に「
ESC」キーを押すと、元の状態に戻ります。
選択画像の拡大/縮小
キーボードによる画像の操作
画像のコントロールにフォーカスがある状態で、キーボードにより以下の操作ができます。
- カーソルキー:画像の移動
- Shift+カーソルキー:画像の移動(高速)
- Ctrl+↑:拡大
- Ctrl+↓:縮小
- Ctrl+V:クリップボードの画像データの貼り付け
範囲選択状態(移動中は除く)では、以下の操作が可能です。
- Ctrl+C:選択範囲をクリップボードにコピー
- Ctrl+X:選択範囲を切り取る
アイコンメニュー
画像編集メニューのアイコンには、以下のような機能があります。
画像編集メニュー
クリックで「
編集モード」と「
OCR範囲設定モード」を切り替えます。
画像を左回転します。
※「OCR範囲指定」をしている場合は、画像に合わせて枠も回転されます。
左回転
画像を右回転します。
※「OCR範囲指定」をしている場合は、画像に合わせて枠も回転されます。
右回転
クリックすると、マウスカーソルが「×」になり、「
傾き補正モード」になります。
左クリックで、始点を決め、水平にしたいラインに合わせて終点を決めた後に、画面上の任意の場所を左クリックするとその角度に合わせて、画像を回転します。
途中でに
右クリックすると、1つ前の状態に戻ります。
傾き補正
トリミングしたい範囲を指定した状態でクリックすると、指定された範囲にトリミングされます。
※「OCR範囲指定」をしている場合は、確認のメッセージが表示され、「はい」をクリックすると全ての範囲が消去されます。
トリミング(実行前)
トリミング(実行後)
切り取りたい範囲を指定した状態でクリックすると、指定された範囲が削除されます(背景色で塗りつぶされます)。「
Ctrl+X」や「
Delete」キーでも削除できます。
切り取り(実行前)
切り取り(実行後)
1つ前の状態に戻します。(最大10回前まで)
範囲を指定した状態でクリックすると、指定された範囲がクリップボードにコピーされます。「
Ctrl+C」キーでも可能です。
クリップボードに有効な画像データがある状態でクリックすると、クリップボードの画像が貼り付けできます。「
Ctrl+V」キーでも可能です。
枠内をドラッグすると、好きな場所に移動できます。枠の端や角を左クリックしてドラッグすると、拡大・縮小ができます。「Shift」キーを押したままドラッグすると、アスペクト比を維持して拡大・縮小できます。枠以外の場所を左クリックすると決定します。
「
消しゴムツールモード」から、範囲を選択し、削除、移動、拡大・縮小を行う「
編集モード」に切り替えます。
「
消しゴムツールモード」に切り替えます。「
消しゴムツールモード」になると、「
消しゴムカーソル」が選択できるようになり、マウスカーソルが「
消しゴムカーソル」で選択された形、サイズに変わります。左クリックで消去し、ドラッグで連続して消去することができます。
「
消しゴムカーソル」の形状、サイズを選択します。
認識結果編集
右画面には、認識結果が表示されます。
「
Ctrl+Z」で「
アンドゥ」、「
Shift+Ctrl+Z」で「
リドゥ」ができます。
フォントやフォントサイズ、色などの設定はメインメニューの「
設定(O)」-「
表示設定(C)」のタブでできます。
認識結果編集メニューのアイコンには、以下のような機能があります。
クリックすると、検索ダイアログが表示されます。
「
検索文字」に検索したい文字(文字列)を入力し、「
検索方向」を指定して「
次を検索(F)」をクリックします。検索は、現在のカーソル位置から検索されます。
「
正規表現(G)」にチェックを入れると、正規表現を用いた高度な検索ができます。「正規表現」の詳細については、ウェブで検索してください。
「
大文字・小文字無視(I)」にチェックを入れると、アルファベットの大文字・小文字を無視して検索します。
検索条件にヒットすると、その箇所が選択状態になります。
クリックすると、置換ダイアログが表示されます。
「
検索文字」に検索したい文字(文字列)、「
置換文字」に置換したい文字(文字列)を入力し、「
開始位置」を指定して「
次を置換(N)」をクリックします。
「
正規表現(G)」にチェックを入れると、正規表現を用いた高度な検索ができます。「
正規表現」の詳細については、ウェブで検索してください。
「
大文字・小文字無視(I)」にチェックを入れると、アルファベットの大文字・小文字を無視して検索します。
「
確認しながら置換」にチェックが入っている場合は、検索文字列にヒットした箇所が選択状態になり、確認用のダイアログが表示されます。
「
一括置換設定」で設定された置換条件を連続して一括置換します。実行する前に、「
一括置換設定」で置換設定を登録しておく必要があります。
メインメニューの「
設定」-「
基本設定」のタブで、「
OCR実行時に、自動的に一括置換を行う(R)」にチェックが入っている場合は、認識実行後、自動的に一括置換が行われます。
「
一括置換設定」で実行する置換の設定を行います。
クリックすると、次のダイアログが表示されます。
「
検索文字」と「
置換文字」を登録して、「
追加」をクリックします。正規表現を使用する場合は、「
正規表現」のチェックボックスにチェックを入れます。「
コメント」は、置換内容を覚えておくためのもので、入力しなくても構いません。
追加すると、下のリストに表示されます。
削除したい場合は、削除したいリストを選択して「
削除」ボタンをクリックします。
一括置換は、リストの上から順番に実行されます。置換順序を変更したい場合は、リストを選んで、希望する位置に
ドラッグ&ドロップします。
既に登録されている設定を修正したい場合は、編集したい項目をクリックするか、「
F2キー」で直接編集出来ます。
「
有効」のチェックボックスのチェックを外すと、リストから削除せずに一時的に無効にできます。
クリックすると、認識結果がクリップボードにコピーされます。
本アプリの基本的な動作設定を行います。
グレースケールに変換して画像を読みこむ(G)
チェックを付けると、メインメニューに画像を追加する際に、画像をグレースケールに変換してから読み込みます。画像サイズが大きい場合は、読み込みに少し時間が掛かります。
起動時に、インターネットに接続されていなければメッセージを表示する(I)
チェックを付けると、起動時にインターネットに接続されていなければ、その旨を表示するダイアログが表示されます。
初期設定でチェックが入っています。
OCR実行後に、自動的に一括置換を行う(R)
チェックを付けると、認識実行後に、「
一括置換設定」で設定した一括置換設定を自動的に行います。
クリップボードにコピーする際に、ファイル名を挿入する(C)
チェックを付けると、認識結果をクリップボードにコピーする際に、先頭にファイル名を挿入します。
認識結果をクリップボードにコピーするには、対象のファイルを選択し、右クリックで表示されるコンテクストメニューの「
認識結果をクリップボードにコピー(C)」をクリックします。画像の□にチェックを入れた状態でコピーすると、チェックの付いた画像の認識結果がコピーされ、その際に、各結果の先頭にファイル名が挿入されます。
前回の状態を復元して起動する(E)
チェックを付けると、メインメニューを終了時に、編集画像や認識結果を保存して終了し、次回起動時にはその状態を復元して起動します。画像の編集途中や、認識結果を編集中に作業を中断したい場合に便利です。
この機能を有効にすると、メインメニューの「
クリアして終了(C)」のボタンがクリックできるようになり、これをクリックして終了すると、リストを全てクリアして終了します。
チェックを外すと、メインメニュー終了時に編集中の画像や認識結果は全て破棄されます。
終了時に、更新確認のメッセージを表示する(F)
画像の編集が行われていたり、認識結果がある場合は、終了時に確認のメッセージが表示されます。
チェックが付いている状態でも、メインメニューの「
クリアして終了(C)」をクリックすると、リストをクリアして終了することができます。
初期設定でチェックが入っています。
認識範囲選択した場合に、範囲毎に改行を挿入する(N)
認識範囲の選択を2つ以上した場合、認識された範囲毎に改行を挿入することができます。チェックを付けると、「
改行数(U)」が編集出来る状態になり、挿入したい改行数を設定出来ます。
通常(チェックが付いていない状態)では、次のように選択範囲の認識結果には改行挿入されません。
「
改行数(U)」を「
1」に設定すると次のように、範囲毎に1行改行が追加されます。
「
改行数(U)」を「
2」に設定すると次のように、範囲毎に2行改行が追加されます。
PDFの動作(P)
PDFを読み込ませた場合の、デフォルトの処理方法を設定します。
「
都度選択する」に設定すると、PDFを読み込む度に、処理選択のダイアログが表示され、画像に変換して読み込むか、そのまま読み込むかを選びます。「
画像に変換して読み込む」に設定すると、常に画像に変換して読み込みます。複数ページのPDFの場合は、ページ選択のダイアログが表示されます。「
そのまま読み込む」に設定すると、画像に変換せず、そのまま読み込みます。
デフォルト認識言語(L)
認識を行う際に、Google Drive APIが判断の基準とする言語です。
Google Drive APIの公式の仕様には、「hints at the language to use」とあり、あくまでも認識を行う際の「ヒント」に過ぎませんので、ここで設定された言語で認識結果が得られるという訳ではありません。例えば、全て日本語の画像を「英語」の設定にして認識させても「日本語」の結果が得られます。
認識結果にはあまり影響がありませんが、通常で使用している(求める認識結果の)言語を設定しておきます。
作業用フォルダを指定する(T)
本アプリで使用する作業フォルダを指定します。通常は設定する必要はありませんが、作業用フォルダを指定したい場合は、チェックすると「
フォルダ選択(M)」ボタンがクリックできるようになり、クリックして表示されるダイアログで、作業用フォルダを指定します。この設定は、
次回起動時から有効になります。「
前回の状態を復元して起動する(E)」の設定を有効にしている状態で作業用フォルダを変更した場合は、リストをクリアしてから終了してください。
認識結果の表示に関する設定をします。
「
認識結果表示フォント」には、設定されているフォント名が、そのフォントと、設定されている文字色で表示されます。
フォント設定(F)
認識結果で表示するフォントとフォントサイズを選択するダイアログを表示します。
※True Typeフォントのみ設定出来ます。
文字色設定(T)
認識結果で表示する文字の色を選択するダイアログを表示します。
改行マークを表示(E)
チェックすると、認識結果の表示で「改行マーク」を表示します。
「改行マーク」が表示されている場合、スクロールの際に画面がちらつきますので、それが気になる場合は非表示にしてください。また、「改行マーク」を表示しても選択することはできませんのでご注意ください。例えば、「検索」や「置換」を行う際に、「\r\n」を指定した場合に、
ヒットはしますが選択状態にならないため、画面上では分かりませんのでご注意ください(改行マークが非表示の場合も同様です)。今後のバージョンアップで対応するかもしれません。
背景色
画像編集の際に、削除、移動、消しゴムツールなどで消去した際の背景色です。グレースケールに変換して画像を読み込んだ画像でも、ここで設定した色で消去されます。
「
背景色の設定(B)」ボタンをクリックすると、色を指定するダイアログが表示され、設定したい色を選ぶことができます。
初期設定では「白色」になっています。
この設定は、
インストールの設定で使用したタブです。
最初に設定したら、以降は設定する必要はありません。
動作チェックは、作者が利用できる限られた環境でしか行っておりませんので、ご使用される環境によってはうまく動作しない場合があります。うまく動作しない場合は、ご協力頂ければできる限り対応致します。